نویسنده : سهراب جلوه گر جلوهگر
![]() |
![]() |
██ متن فصل بیست و یکم نسخهی رایگان ایبوک هوش مصنوعی ██
مترجم: سهراب جلوه گر جلوهگر
فصل یادگیری با استفاده از مشاهدهها؛ و درختهای تصمیمگیری
فهرست برخی از عنوانهای نوشتهها
یادگیری
انواع بازخورد
یادگیری نظارت شده(کنترل شده)
یادگیری بدون نظارت(کنترل نشده)
تقویّت یادگیری(یادگیری تقویّتی)
تعریف یک مسألهی یادگیری
درختهای تصمیمگیری
در گذشته فرض کردیم که دانش اوّلیّه به وسیلهی خبرهها به ما داده شده است و بر چگونگی استفاده از این دانش تمرکز کردیم. حال میخواهیم در این مورد صحبت کنیم که، چگونه دانش را از راه مشاهده به دست آوریم و بر قانونهای گزارهای تمرکز میکنیم؛ مثلاً اگر هوا(وضعیّت جوّی) آفتابی و گرم باشد، آنگاه تنیس بازی کنید و [به صورت گزارهای] مینویسیم:
sunny warm PlayTennis
یا اگر هوا(وضعیّت جوّی) خنک باشد و بارانی باشد یا باد شدید بوزد، آنگاه تنیس بازی نکنید و مینویسیم:
cool (rain strongWind) PlayTennis
یادگیری
برای یک عامل، یادگیری به چه معنی میباشد؟:
تعریف- به این معنی است که، عامل، دانش جدید را دریافت مینماید، دانش جدید را به کار میگیرد، رفتارش را تغییر میدهد و در یک کار معیّن، معیارکارآیی خود را بهبود میبخشد.
عاملهای یادگیرنده
به یاد بیاورید که در گذشته در مورد عاملهای یادگیرنده صحبت کردیم:
یک عامل یادگیرنده دارای یک عنصر کارآیی و یک عنصر یادگیری میباشد. عنصر کارآیی، چیزی است که یک عامل برای تصمیمگیری در مورد اینکه چه کاری انجام دهد، از آن استفاده میکند و این چیزی است که تاکنون مطالعه کردهایم. عنصر یادگیری، چیزی است که به عامل برای بازنگری عنصر کارآیی اجازه میدهد، این ممکن است به معنی اضافه نمودن یا تغییر قانونها یا واقعیّتها، بازنگری یک مکاشفه(ابتکار) و تغییر یک تابع جانشین باشد. یک عامل برای بازنگری کردن رفتارش به اطّلاعاتی که به عامل بگوید چگونه بهخوبی کارش را انجام میدهد، نیازمند میباشد، این اطّلاعات، بازخورد نام دارد.
انواع بازخورد
در اصل سه نوع عملکرد یادگیری وجود دارد که هر کدام بازخورد متفاوتی دارد:
یادگیری نظارت شده (کنترل شده)
تعریف- یکی از عمومیترین شکلهای یادگیری میباشد؛ در این مورد یک منبع خارجی (که اغلب یاد(آموزش) دهنده نام دارد)، عامل را با نمونههای برچسب زده شده ارائه مینماید، که باید از این دادهها برای تشخیص قانونهای کلّیتر استفاده نماید؛
مثلاً نمونهها میتوانند این موردها باشند: لیست بیماران و ویژگیها؛ چه عاملهایی مرتبط با سرطان میباشند؟؛ چه عواملی فردی را دارای خطر میداند؟؛ بهترین سؤالات برای طبقهبندی حيوانها چیست؟؛ صورت چه فردی یا چه جانوری در این تصویر میباشد؟؛ این پردازش یادگیری(به دست آوردن) قانونهای کلّی، از واقعیّتهای مشخّص، استنتاج نام دارد. عامل، موردهای(عملکردهای) معیّنی را در طول طبقهبندیاشان میبیند.
در شکل بالا وقتی که عامل، عنکبوت را به اشتباه مارمولک میپندارد، آموزش دهنده این مطلب را به او میگوید.
یادگیری بدون نظارت (کنترل نشده)
تعریف- در این مورد آموزش دهندهای برای ارائهی نمونهها وجود ندارد و عامل معمولاً برای پیداکردن الگوهایی در دادهها تلاش مینماید.
تقویّت یادگیری(یادگیری تقویّتی)
تعریف- یک نوع مخصوص از یادگیری است که در آن عامل فقط درست بودن یا غلط بودن را برای انجام یک عمل دریافت مینماید و ممکن است «بهترین» عملکرد را برای انجام نداند.
در شکل بالا وقتی که عامل به اشتباه عنکبوت را مارمولک میپِندارد، کارشناس(خبره)، غلط بودن این پندار را به او میگوید و عامل دوباره خود را بهروز کرده و تلاش میکند.
تعریف یک مسألهی یادگیری
میتوانیم مسألهی یادگیری را با تخمین، به صورت یک تابع f، که به ما میگوید چگونه یک مجموعه از ورودیها را طبقهبندی نماییم، تفسیر کنیم؛ یک مثال در این مورد یک مجموعه از ورودیهای x و f(x) متناظر میباشد:
<<Mammal ,Eats-Meat ,Black-Stripes ,Tawny >,Tiger >
شکل بالا- بَبر
درختهای تصمیمگیری
تعریف نخست: درخت تصمیمگیری، روشی(نموداری درختی) برای بیان تصمیمگیریهای ترتیبی و نتیجههای ممکن از این تصمیمگیریها است.
تعریف دوّم: درخت تصمیمگیری، نموداری درختی است که برای تصمیمگیری در تجارت یا برنامهنویسی کامپیوتر مورد استفاده قرار میگیرد و در آن، گرهها(گزینهها) با در نظر گرفتن ریسکها، هزینهها، نتیجهها یا احتمالها بیان میشوند.
در هر گره، در درخت، یک ویژگی آزمایش(تست) میشود. در زیر، یک درخت تصمیمگیری را میبینید:
چکیدهی مطلبهای فصل بیست و یکم
برای یک عامل، یادگیری به این معنی است که، عامل، دانش جدید را دریافت مینماید، دانش جدید را به کار میگیرد، رفتارش را تغییر میدهد و در یک کار معیّن، معیارکارآیی خود را بهبود میبخشد.
یک عامل برای بازنگری کردن رفتارش به اطّلاعاتی که به عامل بگوید چگونه بهخوبی کارش را انجام میدهد، نیازمند میباشد، این اطّلاعات، بازخورد نام دارد.
سه نوع عملکرد یادگیری وجود دارد که هر کدام بازخورد متفاوتی دارد: یادگیری نظارت شده، یادگیری بدون نظارت، و تقویّت یادگیری.
درخت تصمیمگیری، نموداری درختی برای بیان تصمیمگیریهای ترتیبی و نتیجههای ممکن از این تصمیمگیریها است.
نظرات شما عزیزان:
:: برچسبها: ██ متن فصل بیست و یکم نسخهی رایگان ایبوک هوش مصنوعی ██ , مترجم: سهراب جلوه گر جلوهگر , فصل یادگیری با استفاده از مشاهدهها؛ و درختهای تصمیمگیری , آموزش هوش مصنوعی,